7赞

Python的`urllib2`:当我在维基百科页面上"urlopen"时,为什么会出现错误403？

作者：虎仔球妈_459 | 2023-07-04 12:05

如何解决《Python的`urllib2`:当我在维基百科页面上"urlopen"时,为什么会出现错误403？》经验，为你挑选了3个好方法。

尝试urlopen维基百科的某个页面时,我有一个奇怪的错误.这是页面:

http://en.wikipedia.org/wiki/OpenCola_(drink)

这是shell会话:

>>> f = urllib2.urlopen('http://en.wikipedia.org/wiki/OpenCola_(drink)')
Traceback (most recent call last):
  File "C:\Program Files\Wing IDE 4.0\src\debug\tserver\_sandbox.py", line 1, in 
    # Used internally for debug sandbox under external interpreter
  File "c:\Python26\Lib\urllib2.py", line 126, in urlopen
    return _opener.open(url, data, timeout)
  File "c:\Python26\Lib\urllib2.py", line 397, in open
    response = meth(req, response)
  File "c:\Python26\Lib\urllib2.py", line 510, in http_response
    'http', request, response, code, msg, hdrs)
  File "c:\Python26\Lib\urllib2.py", line 435, in error
    return self._call_chain(*args)
  File "c:\Python26\Lib\urllib2.py", line 369, in _call_chain
    result = func(*args)
  File "c:\Python26\Lib\urllib2.py", line 518, in http_error_default
    raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 403: Forbidden

这发生在我不同大陆的两个不同系统上.有谁知道为什么会这样？

1> Jochen Ritze..：

维基百科的立场是:

数据检索:对于与批准的机器人任务没有直接关系的任何用途,Bots不得用于检索批量内容.这包括从其他网站动态加载页面,这可能导致网站被列入黑名单并被永久拒绝访问.如果您想下载批量内容或镜像项目,请下载或托管您自己的数据库副本.

这就是Python被阻止的原因.你应该下载数据转储.

无论如何,你可以在Python 2中阅读这样的页面:

req = urllib2.Request(url, headers={'User-Agent' : "Magic Browser"}) 
con = urllib2.urlopen( req )
print con.read()

或者在Python 3中:

import urllib
req = urllib.request.Request(url, headers={'User-Agent' : "Magic Browser"}) 
con = urllib.request.urlopen( req )
print con.read()

2> S.Lott..：

要调试它,您需要捕获该异常.

try:
    f = urllib2.urlopen('http://en.wikipedia.org/wiki/OpenCola_(drink)')
except urllib2.HTTPError, e:
    print e.fp.read()

当我打印生成的消息时,它包括以下内容

"英语

我们的服务器目前遇到技术问题.这可能是暂时的,应尽快解决.请在几分钟后再试一次."

3> Eli..：

网站通常会通过检查是否由公认的用户代理访问来过滤访问.维基百科只是将您的脚本视为机器人并拒绝它.尝试欺骗浏览器.以下链接将为您提供一篇文章,向您展示如何.

http://wolfprojects.altervista.org/changeua.php

推荐阅读

程序员
角js有哪些替代方案？

如何解决《角js有哪些替代方案？》经验，为你挑选了1个好方法。 ... [详细]
程序员
RxJava在活动恢复后重新订阅事件

如何解决《RxJava在活动恢复后重新订阅事件》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用底部深层链接打开活动或片段

如何解决《使用底部深层链接打开活动或片段》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何导入列表项？

如何解决《如何导入列表项？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用WP API v1和v2打破Android Loopj图像上传

如何解决《使用WPAPIv1和v2打破AndroidLoopj图像上传》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么JavaFX不包含在Ubuntu Wily(15.10)的OpenJDK 8中？

如何解决《为什么JavaFX不包含在UbuntuWily(15.10)的OpenJDK8中？》经验，为你挑选了2个好方法。 ... [详细]
程序员
无法使用YTPlayerView NSCocoaErrorDomain Code = 258嵌入YouTube视频

如何解决《无法使用YTPlayerViewNSCocoaErrorDomainCode=258嵌入YouTube视频》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Promise从Angularjs中的JSON文件读取数据

如何解决《使用Promise从Angularjs中的JSON文件读取数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用lpSolveAPI获得0/1-Knapsack MILP的多种解决方案

如何解决《使用lpSolveAPI获得0/1-KnapsackMILP的多种解决方案》经验，为你挑选了1个好方法。 ... [详细]
程序员
UIActivityViewController将sourceView设置为UIBarButtonItem

如何解决《UIActivityViewController将sourceView设置为UIBarButtonItem》经验，为你挑选了1个好方法。 ... [详细]
程序员
Node.js中的createServer方法

如何解决《Node.js中的createServer方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
在运行Django单元测试时强制删除任何先前的测试数据库(autoclobber),例如在PyCharm中

如何解决《在运行Django单元测试时强制删除任何先前的测试数据库(autoclobber),例如在PyCharm中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何以编程方式将箭头功能与常规功能区分开？

如何解决《如何以编程方式将箭头功能与常规功能区分开？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用内联汇编在数组上循环

如何解决《使用内联汇编在数组上循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法从'const char [3]'转换为'char *'x100000（Qt Creator C ++ Windows 32）

如何解决《无法从'constchar[3]'转换为'char*'x100000（QtCreatorC++Windows32）》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何隐藏CefSharp.WinForms.ChromiumWebBrowser右键单击上下文菜单？

如何解决《如何隐藏CefSharp.WinForms.ChromiumWebBrowser右键单击上下文菜单？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用WebApi的OData路由在导航问题上引发异常

如何解决《使用WebApi的OData路由在导航问题上引发异常》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Objective-C类中使用时,无法在调试区域中看到Swift对象层次结构

如何解决《在Objective-C类中使用时,无法在调试区域中看到Swift对象层次结构》经验，为你挑选了1个好方法。 ... [详细]
程序员
我可以使用Oracle PL/SQL RANGE子句来约束变量的数据类型？

如何解决《我可以使用OraclePL/SQLRANGE子句来约束变量的数据类型？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何实现Typescript异步等待模式:Promise在哪里

如何解决《如何实现Typescript异步等待模式:Promise在哪里》经验，为你挑选了0个好方法。 ... [详细]

虎仔球妈_459

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章